AI资讯新闻榜单内容搜索-Mechanisti

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Mechanisti
ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

近年来,大语言模型展现出了越来越强的能力,从上下文学习(In-Context Learning, ICL)到复杂推理、代码生成,这些能力不断刷新人们对模型能力边界的认知。

来自主题: AI技术研报
8814 点击    2026-06-29 09:19
大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

过去几年,机制可解释性(Mechanistic Interpretability)让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成:从单个神经元到注意力头,再到跨层电路。但在很多场景里,研究者真正关心的不只是 “模型为什么这么答”,还包括 “能不能更稳、更准、更省,更安全”。

来自主题: AI技术研报
11041 点击    2026-01-28 10:13
EMNLP2025 | 通研院揭秘MoE可解释性,提升Context忠实性!

EMNLP2025 | 通研院揭秘MoE可解释性,提升Context忠实性!

EMNLP2025 | 通研院揭秘MoE可解释性,提升Context忠实性!

在大模型研究领域,做混合专家模型(MoE)的团队很多,但专注机制可解释性(Mechanistic Interpretability)的却寥寥无几 —— 而将二者深度结合,从底层机制理解复杂推理过程的工作,更是凤毛麟角。

来自主题: AI技术研报
10418 点击    2025-11-17 09:25